查看原文
其他

DALL·E 3 将于10月份发布,到时可在 ChatGPT Plus 和 API 上体验

我是哥飞 哥飞 2023-11-29

大家好,我是哥飞。

今天哥飞给大家介绍 OpenAI 的文生图服务 DALL·E 的最新版本 DALL·E 3 。

DALL·E 2是在 2022 年的 11 月 3 日对外发布API的,而 ChatGPT 是在 2022 年 11 月 30 日上线网页版的。

我们大多数人了解 OpenAI 都是因为 ChatGPT 的爆火。

2022 年 11 月 30 日相当于是AI世界的命运齿轮转动时刻。

好我们回到 DALL·E 2 ,先介绍一下 DALL·E 2 有哪些能力。


一、DALL·E 2

1.1、DALL·E 2 基本信息

官网: https://openai.com/dall-e-2

在线体验: https://labs.openai.com/

模型介绍: https://platform.openai.com/docs/models/dall-e

API文档: https://platform.openai.com/docs/api-reference/images


1.2、创建图像

接口:https://api.openai.com/v1/images/generations

能力:文本生成图像

主要请求参数有三个,prompt是画图提示词,n是一次生成的图片数量,size是图像大小,目前支持256x256、512x512和1024x1024三种规格,也就是DALL·E 2只支持正方形图片:

curl https://api.openai.com/v1/images/generations \ -H "Content-Type: application/json" \ -H "Authorization: Bearer $OPENAI_API_KEY" \ -d '{ "prompt": "A cute baby sea otter", "n": 2, "size": "1024x1024"  }'

返回数据中直接带了图片url数组:

{ "created": 1589478378, "data": [ { "url": "https://..." }, { "url": "https://..." } ]}

举例,提示词“An astronaut riding a horse in photorealistic style.” 生成的图像为:


1.3、编辑修改图像

接口:https://api.openai.com/v1/images/edits

能力:用提示词对上传的图像进行修改

主要请求参数有五个,在创建图片的参数基础上增加了两个,一个是原图 image ,一个是遮罩 mask:

curl https://api.openai.com/v1/images/edits \ -H "Authorization: Bearer $OPENAI_API_KEY" \ -F image="@otter.png" \ -F mask="@mask.png" \ -F prompt="A cute baby sea otter wearing a beret" \ -F n=2 \  -F size="1024x1024"

原图必须是正方形的png图片,遮罩 mask 也是一张png图片,mask 尺寸必须跟原图 image 尺寸一致。

mask 的透明区域就是模型会修改的区域,必须严格透明且支持不规则边界。


1.4、生成相似但有变化的图片

接口:https://api.openai.com/v1/images/variations

能力:上传一张图,生成几张相似但有变化的图片

主要参数有3个,image 是我们上传的原图,n是生成图片数量,size是图片尺寸:

curl https://api.openai.com/v1/images/variations \ -H "Authorization: Bearer $OPENAI_API_KEY" \ -F image="@otter.png" \ -F n=2 \  -F size="1024x1024"

返回值跟生成图像一样。

举例上传第一张图,生成后四张相似图片:


1.5、扩图 Outpainting

这个能力目前没有对外提供接口,不过可以在官网看到效果示例,下方上图是输入的图片,下图是扩出的图片。


1.6、修图 Inpainting

这里哥飞不太清楚,是否跟1.3是同一个接口。

举例,输入图像是下方左图,用提示词“Add a flamingo beside the pool.”得到了下方右图。


好了,DALL·E 2 我们介绍完了,下面看看新发布的 DALL·E 3 有什么不一样。

二、DALL·E 3

2.1、DALL·E 3 基本信息

官网: https://openai.com/dall-e-3

2.2、DALL·E 3 细节控制

支持通过 prompt 对图像每一处细节进行控制,如以下几句提示词,完全可以认为就是一段故事中的场景描述,拿来就能够生成合适的图片。

The sidewalks bustling with pedestrians enjoying the nightlife.

A bustling city street under the shine of a full moon.

At the corner stall, a young woman with fieryred hair, dressed in a signature velvet cloak.s hagaling with the grumpv old vendor.

The grumpy vendor, a tall, sophisticated man, is wearing a sharp suitsports a noteworthy moustache and is animatedly conversing on hissteamounk telephone.

2.3、画面更精美

即使是同一段提示词,相比于DALL·E 2,DALL·E 3画出的画面也会更精美。

如提示词“An expressive oil painting of a basketball player dunking, depicted as an explosion of a nebula”,下方左图是DALL·E 2生成,右图是DALL·E 3 生成。


2.4、DALL·E 3 集成 ChatGPT 

到时大家可以在 ChatGPT 中直接用对话来画图,哪里画得不满意,可以直接用自然语言和GPT沟通,让GPT去修改。

以下是官网给出的一些示例。

2.5、创意掌控

DALL·E 3将拒绝提供在世艺术家风格图像的生成请求,创作者也可以提交申请将自己的作品从模型训练数据集中删除。


三、为什么哥飞介绍这个?

哥飞是吃饱了撑的,来介绍这个吗?

当然不是了。

之前我们在这篇文章中说了《找新词:一个永远有效的建站策略,让你快速拿到搜索引擎流量》。

那么今天哥飞就给你介绍了一个新词“DALL·E 3”,围绕着这个新词,你能去做什么呢?

这是哥飞留给你的今日作业,欢迎在评论中留言写作业。

你也可以加入哥飞运营的付费社群“哥飞的朋友们”,一起来讨论到底如何基于这个新词去做网站,去搞流量,去赚钱。

这个社群从7月2日成立到现在两个半月的时间了,总共有335位朋友加入了。

为什么一个定价666元一年的社群会有这么多朋友愿意加入呢?

因为哥飞一直坚持利他分享,让大家知道怎么找方向,知道怎么做网站,知道怎么获取流量,知道怎么流量变现。

经常有朋友跟哥飞说,加入哥飞的这个社群,是今年做的最正确决定之一。

正在读文章的你,如果你决定加入哥飞的这个社群,哥飞敢保证,也绝对是你今年剩下的时间里做的最正确的决定之一。

不管加不加社群,都请加哥飞微信 qiayue ,欢迎交流。

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存